import fileinput, time, re
i,a = 0,0
list = []
f=file('ss.html','r')
text = f.read()
list = re.findall('<b>[0-9+][0-9+][/][0-9+][0-9+][/][0-9+][0-9+][0-9+][0-9+]|[0-9+][0-9+][:][0-9+][0-9+]|NON&#160;ASSEGNATO|RIPOSO|DISPONIBILITA|ASSENZA|INTERVALLO|FERIE',text)
while i < len(list):
  a = list[i].find('<b>')
  if a != -1:
    list[i] = list[i][a+3:]
   
  b = list[i].find('&#160;')
  if b != -1:
    list[i] = list[i][0:b] + list[i][b+6:]
  i = i + 1
print list




#ESPRESSIONE regolare per la ricerca della data in neretto 
#cat s.html |grep '<b>'[0-9+][0-9+][/][0-9+][0-9+][/][0-9+][0-9+][0-9+][0-9+]
#ricerca dell'ora inizio-termine servizio
# cat s.html |grep [0-9+][0-9+][:][0-9+][0-9+] ricerca ora inizio termine prestazione
# altri tipi di servizio RIPOSO, INTERVALLO, DISPONIBILITA, ASSENZA, NON ASSEGNATO, ecc

